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改进 文 持 回 量 机 在 棉铃 虫 人 工 饲 料 配 方 优 化 中 的 应 用 
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摘要 : 发 展 新 的 实验 设计 与 分 析 方 法 ， 通 过 实施 尽 可 能 少 的 实验 而 获得 满意 配方 对 动 植物 彰 养 、 发 酵 工程 等 复杂 
因素 多 水 平 寻 优 问题 极为 重要 。 本 研究 结合 均匀 设计 (uniform design，UD) 与 文 持 回 量 回归 (support vector regression ， 
SVR) ， 提 出 了 一 种 新 的 配方 优化 实验 设计 与 分 析 方 法 UD-SVR， 将 其 应 用 于 棉铃 虫 Helicoverpa armigera( Hiibner) 幼 
忠 人 工 饲 料 配 方 优化 。 结 果 表 明 : 在 考虑 6 因素 时 仅 通过 2 轮 22 个 实验 ,表征 配方 优 劣 的 指标 一 一 平均 肾 重 即 由 
初始 的 0.2436 g 高 效 提升 至 0. 3044 g， 明显 优 于 二 次 多 项 式 偏 最 小 二 乘 回归 等 经 验 风 险 最 小 参 比 模型 。UD-SVR 预 
测 精 度 高 、 指 导 性 强 、 可 解释 性 好 、 优 化 高 效 ， 有 望 在 多 因素 多 水 平 配方 优化 中 得 到 广泛 应 用 。 

关键 词 : 棉铃 虫 ; 人 工 饲料 ; 均匀 设计 ; 支持 向 量 回归 ; 配方 优化 

中 图 分 类 号 : Q965 ”文献 标识 码 : A ”文章 编号 : 0454-6296(2010)04-0420-07 

Application of improved support vector machine in the optimization of 





artificial diet for the cotton bollworm, Helicoverpa armigera ( Lepidoptera: 


Noctuidae ) 

LI Jun'”, TAN Xian-Sheng ,TAN Si-Qiao’, YUAN Zhe-Ming *’*, XIONG Xing-Yao” (1. College of 
Bio-safety Science and Technology, Hunan Agricultural University, Changsha 410128, China; 2. Hunan 
Provincial Key Laboratory of Crop Germplasm Innovation and Utilization, Hunan Agricultural University, 
Changsha 410128 ，China ) 

Abstract : The development of new experimental design and analysis methods that can provide satisfactory 
formula through conducting as few experiments as possible is extremely Important for complex multi-factor 
and multi-level optimization problem, such as animal and plant nutrition, and fermentation engineering. 
Based on uniform design and support vector regression, a novel experimental design and analysis method 
named as UD-SVR for the prescription optimization was proposed. It was applied to optimize the 
complicated artificial diet including six factors for the cotton bollworm, Helicoverpa armigera ( Hiibner ) . 
The optimization results showed that the mean pupal weight increased from 0.2436 g in the initial 
benchmark formulation to 0. 3044 g in the optimal prescription after carrying out only 22 schemes. UD-SVR 
is more efficient than the reference models and has the potential to be widely used for experimental design 
and analysis of the prescription optimization. 

Key words: Helicoverpa armigera; artificial diet; uniform design; support vector regression; 


prescription optimization 


在 动 植物 营养 、 发 本 工程 等 诸多 领域 中 ,发 展 。” 交 设 计 整 齐 可 比 的 要 求 ， 只 考虑 试验 点 的 均匀 分 散 
新 的 实验 设计 与 分 析 方 法 ， 通 过 实施 尽 可 能 少 的 实 性 ,可 使 每 因素 每 水 平 仅 做 一 次 试验 ， 因 而 试验 次 
验 获得 较 优 配方 对 复杂 多 因素 多 水 平实 验 极为 重要 ” 数 可 大 幅度 降低 ( 方 开 泰 ，1980; 唐 启 义 和 冯 明 
( 方 开 厅 ，1980; 英美 华 和 庞 雄 飞 ，2007; 爱 哲 明 光 ，2002)。 均匀 设计 后 续 回 归 分 析 常 采用 基于 经 
等 ，2009 ) 。 均 匀 设 计 (uniform design，UD ) 抛 开 正 验 风 险 最 小 的 逐步 线性 回归 (stepwise linear 
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regression，SLR ) 、 多 元 线性 回归 (multiple linear 
regression，MLR )、 二 次 多 项 式 回 归 (quadratic 
polynomial regression ，QPR )、 偏 最 小 二 乘 回 归 
(partial least-squares regression ，PLR )、 偏 最 小 二 
乘 二 次 多 项 式 回 归 (PLS-QPR) 和 人 工 神经 网 络 
(artificial neural networks ，ANN ) 等 方法 ， 其 理论 基 
础 是 大 数 定 律 ， 只 有 当 训练 样 本 数目 趋 近 于 无 穷 大 
时 ， 规 律 才能 被 统计 出 来 ; 而 配方 优化 是 典型 的 小 
样本 ， 基 于 经 验 风 险 最 小 的 传统 方法 在 小 样本 条 件 
下 泛 化 能 力 不 足 ， 优 化 效果 往往 并 不 理想 。 同 时 ， 
配方 中 各 因子 、 因 变量 之 间 往 往 存 在 非 线性 关系 ， 
而 SLR，QPR 和 PLR 是 线性 或 拟 线性 的 ， 非 线性 
解析 能 力 不 足 (Rosipal and Trejo，2001) 。 以 啊 应 
面 方法 优化 配方 时 ， 重 构 函 数 的 选择 是 一 个 关键 问 
题 ， 通 党 采用 的 二 次 多 项 式 对 非 线性 函数 的 逼近 能 
力 有 限 ( Gupta and Manohar，2004 ) 。ANN 虽 能 解 
决 非 线性 问题 ， 但 存在 模型 结构 难以 确定 、 可 解释 
性 差 、 钨 于 出 现 过 度 训 练 和 训练 不 足 、 吻 于 陷入 局 
部 极 小 与 维 数 灾难 等 问题 (Chakraborty et al.，, 
1992 ) 。 支 持 向 量 机 (support vector machine，SVM ) 
基于 结构 风险 最 小 ， 较 好 地 解决 了 小 样本 、 非 线 
性 、 过 拟 合 、 维 数 灾难 和 局 部 极 小 等 问题 ， 泛 化 推 
广 能 力 优异 (Vapnik，1995; 邓 疙 扬 和 田 英 杰 ， 
2004) ， 但 存在 可 解释 性 差 、 核 吨 数 选择 依赖 经 
验 、 对 大 训练 样本 计算 复杂 度 高 等 缺陷。SVM 包 
括 支 持 回 量 分 类 ( support vector classification ，SVC ) 
和 支持 癌 量 回 归 ( support vector regression，SVR ) 。 

棉铃 虫 Helicoverpa armigera( Hiibner) 为 分 布 广 
泛 的 杂食 性 多 寄主 害虫 ， 因 其 危害 严重 、 抗 药性 发 
展 快 、 抗 逆 能 力 强 等 原因 成 为 昆虫 生理 、 抗 药性 与 
防治 技术 等 研究 的 重要 实验 昆虫 。 为 实现 室内 种 群 
的 继 代 饲养 ， 获 得 大 量 生 长 健壮 、 发 育 整 齐 的 试 
虫 ,棉铃 虫 人 工 饲 料 配方 优化 非常 重要 (时 乐 奶 
等 ，1981; 吴 坤 君 ，1985 ) 。 本 研究 在 改进 SVR 缺 
陷 的 基础 上 ， 绪 合 均 勺 设计 与 SVR 提出 了 一 种 新 
的 实验 设计 与 分 析 方法 UD-SVR， 将 其 应 用 于 棉铃 
虫 人 工 饲 料 配 方 优化 ， 绪 果 表 明 新 方法 优化 效果 显 
车、 指导 性 强 、 可 解释 性 好 。 


1 材料 与 方法 
1. 1 ” 虫 源 与 饲养 管理 


棉铃 虫 卵 块 购 目 武汉 科 话 生物 农药 有 限 公司 ， 
并 由 本 实验 室 在 基准 配方 人 工 饲料 上 继 代 饲 养 3 代 


以 上 。 初 孵 幼 虫 单 虫 饲 于 24 孔 Corming 细胞 培养 板 
中 (了 筷 板 筷 直 径 15.6 mm， 生 长 面积 1.9 cm ) ，3 
龄 前 后 转移 至 6 孔 Coming 细胞 培养 板 单 虫 饲养 
( 孔 板 直径 34. 8 mm， 生 长 面积 9.5 cm ) ， 定 期 更 
换 饲 料 、 清 理 培 养 板 ， 直 至 幼虫 化 贤 。 培 养 板 置 于 
温度 27 +1%C ， 光 周期 L:D =14:10，RH 60% ~80% 
的 光照 培养 箱 中 。 
1.2 基准 人 工 饲 料 配 方 

棉铃 虫 基 准 人 工 饲 料 配 方 为 本 室 多 年 饲养 的 经 
验 配 方 ， 室 内 继 代 饲养 多 代 ， 种 群 无 明显 衰退 。 基 
准 人 工 饲 料 含 以 下 3 组 分 : I 组 为 黄豆 粉 100 g， 
麦 菊 100 g， 酵 母 浸 襄 100 g， 诬 糖 4 g， 末 籽 油 4 
滴 ; 工 组 为 琼脂 12 g; 下 组 为 维生素 C 所 ( 维 福 佳 
牌 )50 粒 ，21 金 维 他 族 0.5 粒 ， 山 梨 酸 1.6 g， 冰 
乙酸 1 mL( 维生素 C 片 和 21 金 维 他 片 用 时 磨 细 )。 
配制 时 ,将 I 组 倒 人 500 mL 温水 中 搅拌 均匀 ， 
组 琼脂 于 500 mL 水 中 煮沸 融化 ， 混 合 工 组 和 开 组 ， 
高 压 蒸汽 灭 菌 30 min， 待 温度 降 至 50C 左右 时 加 
和信 卫 组 成 分 ， 快 速 混 匀 后 冷藏 备用 。 
1.3 支持 向 量 回 归 与 LIBSVM 2. 8 软件 包 

SVM 起 初 是 用 于 解决 线性 可 分 情况 下 两 类 样 
本 的 分 类 问题 (SVC) ， 其 核心 思想 是 找到 一 个 最 优 
分 类 超 平面 ， 使 两 类 样本 的 分 类 间隔 最 大 化 。SVR 
与 SVC 相似 ,但 SVR 所 求 超 平面 是 使 所 有 样本 点 
到 超 平面 的 距离 为 最 小 。 对 于 线性 回归 问题 ， 给 定 
样本 集 (x;,y;) ， 其 中 i = 1,…,n;x € R";y eR,， 
问题 变 为 寻求 一 个 最 优 超 平面 ， 使 得 在 给 定 精 度 s 
(seE=0) 条 件 下 可 以 无 误差 地 拟 合 y ， 即 所 有 样本 
点 到 最 优 超 平面 的 距离 都 不 大 于 es; 考虑 到 人 允许 误 
差 的 情况 ， 可 引入 松弛 变量 E 和 &” =0 以 及 惩罚 参 
数 C>0， 其 寻 优 问题 转化 为 相应 的 带 约 束 条 件 的 
二 次 规划 问题 ， 将 该 优化 问题 转化 成 对 个 问题 后 即 
可 解 得 最 优 回归 哨 数 。 仪 有 少 部 分 样本 的 Lagrange 
乘 子 a 不 为 去 ， 因 此 决定 该 超 平 面 的 样本 只 能 是 
这 些 文 持 癌 量 。 对 于 非 线 性 回归 问题 ， 可 通过 核 隐 
数 变换 将 样本 映射 到 一 个 高 维特 征 空间 中 用 线性 回 
归来 解决 。 通 常 ， 特 征 空间 具 很 高 甚至 无 穷 维 数 ， 
致使 空间 变换 后 计算 量 巨 增 而 面临 维 数 灾难 等 问 
题 。 注 运 的 是 SVM 中 竺 解 对 偶 问 题 只 包含 一 个 变 
换 后 特征 空间 内 积 运算 ， 而 这 种 运算 能 在 原 空间 中 
通过 核 困 数 来 实现 。 有 关 SVM 和 SVR 的 详细 内 容 
参见 Vapnik (1995 ) ， 张 学 工 (2000 ) 和 边 黎 裤 等 
(2000 ) 。 

LIBSVM 2. 8 软件 包 的 SVR 功能 需 用 到 4 个 常 
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用 程序 Svmscale 用 于 对 原始 数据 规格 化 ， 
Svmtrain 用 于 训练 ，Svmpredict 用 于 预测 ， 
Gridregression. py 用 于 目 动 搜索 核 郴 数 最 优 参数 c， 
g, plce([l -1,6],ge([l-8,0],pe(l -8, 
-1]， 步 长 均 为 1)。 各 程序 用 法 及 其 参数 设置 参 
见 文献 (Chang and Lin, 2001 ) 。 


2 UD-SVR 优化 过 程 与 分 析 


先 给 出 UD-SVR 配方 优化 流程 框图 (图 1) ， 再 
结合 实验 进程 分 步 详细 介绍 。 


基准 配方 及 各 因子 
上 下 限 


均匀 设计 


各 因子 最 优 水 平 组 合 


轮流 加 入 非 保 留 因子 ， 单 因子 效应 
分 析 确 定 各 非 保 留 因子 最 优 水 平 


配方 满意 ? 若 满意 
优化 过 程 结束 


选择 核 函 数 ， 盘 选 因子 







确定 各 因子 最 优 水 平 
和 上 下 限 是 否 外 推 
统计 频次 寻 优 
预测 ， 取 大 于 阔 值 的 
组 合 











单 因 子 效 应 分 析 确 定 各 保 SVR 建 模 并 评估 模型 以 保留 因子 的 全 组 合 
留 因子 最 优 水 平 (双重 留 一 法 ) 构建 测试 集 


图 1 UD-SVR 配方 优化 流程 


Fig. 1 


2.1 基准 配方 及 各 因素 上 下 限 
配方 优化 考虑 6 因素 ， 各 因素 基准 、 上 下 限 见 
表 1。 其 他 组 分 同 1.2 基准 人 工 饲料 配方 。 
表 1 基准 方案 中 各 因素 的 上 下 限 
Table 1 Lower limit and upper limit of components 


in benchmark formulation 


因子 基准 上 限 下 限 


Factor Benchmark Upper limit Lower limit 


黄豆 粉 


100 128 40 
Soybean powder, x1 (g/L) 
麦 苏 
100 110 10 
Wheat bran, x, (g/L) 
酵母 浸 膏 
100 150 50 
Yeast extract, x3 (g/L) 
4 20 2 
Sucrose, x4 ( g/L) 
菜 籽 油 ( 滴 / 工 ) 0 ) 
Rapeseed oil, xs ( drop/L) 
维生素 C( 粒 / 工 ) 
50 98 10 


Vitamin C, we (tablet/L) 


Flow chart of prescription optimization methods based on UD-SVR 


2.2 第 工 轮 均匀 设计 

依 表 1 按 6 因素 12 水 平 以 DPS 进行 均匀 设计 
( 唐 局 义 和 汉 明光 ，2002) ， 共 12 个 处 理 (N, ~ 
Ni ) ， 每 处 理 供 试 幼虫 48 头 ， 单 虫 饲 养 ( 即 每 处 理 
48 重复 ， 下 同 ) 。 各 处 理 因 子 水 平 组 合 及 实测 平均 
肾 重 见 表 2。 可 知 ， 第 1 轮 均 匀 设 计 晴 重 最 大 的 4 
个 处 理 N ，N,，N; ，Ns 与 基准 人 工人 饲料 CK 均 无 
显著 差异 ， 需 进一步 优化 。 
2.3 最 优 核 函 数 选 择 与 非 线性 变量 筛选 

SVR 常用 核 函 数 有 4 种 : 线性 核 函数 (1 =0)， 
多 项 式 核 国 数 ( 上 =1) ， 径 向 基 核 函数 (4=2) 以 及 
sigmoid 核 函数 (1 =3)。 针 对 SVR 核 函 数 的 选择 依 
赖 经 验 、 缺 乏 先 验 理 论 指导 的 缺陷 ， 豆 上 哲 明 等 
(2007) 、 张 永生 等 (2007 ) 发 展 了 以 4 种 常用 核 也 
数 依 次 按 留 一 法 进行 交叉 测试 、 取 均 方 误差 (mean 
squared error，MSE ) 最 小 者 为 最 优 核 函数 的 核 函 数 
自动 寻 优 算法 与 程序 。 不 同 于 逐步 线性 回归 等 线性 
目 变 量 租 选 方法 ， 袁 哲 明 等 (2007)、 齐 显 胜 等 
(2008 ) 还 基于 SVR 给 出 了 一 种 非 线 性 的 变量 筛选 
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表 2 第 工 轮 均匀 设计 方案 及 实测 晴 重 


Table 2 The lst-round uniform design and mean pupal weight 








实验 组 Scheme Xl MX2 MX3 MX4 Xs 
Ni 120 40 140 5 10 
N, 72 $0 150 11 2 
N; 104 90 120 8 6 
Ny 48 70 80 2 9 
N; 88 120 100 3.5 4 
Ne 128 110 50 12.5 8 
N, 112 60 70 18.5 3 
Ns 96 20 90 15.5 12 
No 40 30 110 14 7 
Nio 80 80 60 9.5 13 
N 64 10 40 6.5 5 
Ni1> 30 100 130 17 11 
CK 100 100 100 4 4 


肾 重 y (平均 值 + 标 准 误 ) (8g) 


和 Pupal weight (mean + SE) 
74 0. 2563 上 0. 0052 aA 

34 0. 2445 +0. 0063 abAB 

10 0. 2291 +0. 0061 beBCDE 
26 0. 2039 +0. 0050 dF 

82 0. 2048 + 上 0. 0063 dF 

42 0. 2330 上 0. 0054 beABCDE 
66 0. 2464 +0. 0043 abAB 

18 0. 2439 +0. 0061 abABC 
90 0. 2100 £0. 0072 dEF 

98 0. 2354 上 0. 0055 beABCD 
50 0. 2198 +0. 0052 edCDEF 
58 0. 2294 +0. 0055 beBCDE 
50 0. 2436 +0. 0070 abABC 








Ni ~ Ny 为 均匀 设计 处 理 ，CKi 为 基准 人 工 饲料 对 照 。 晴 重 数据 后 有 不 同 字 母 表示 差异 显著 ， 小 写 和 大 写字 母 分 别 代表 显著 水 平 为 已 <0. 05 
和 P<0.01(Duncan 氏 新 复 极 差 法 检验 ); 下 同 。Ni - Ni, are schemes based on uniform design; NK is the benchmark formulation for the control. 


Different small and capital letters mean significant difference by Duncan’ s new multiple range test at the 9% level and 1% level, respectively. The same 


for the following tables. 


方法 : 以 多 轮 末 尾 淘 汰 法 从 包含 全 部 输入 变量 的 
SVR 模型 中 以 留 一 法 依 MSE 最 小 原则 非 线性 逐次 
曙 除 对 提高 预测 精度 不 利 的 变量 ， 竹 选 后 的 变量 即 
为 保留 因子 。 在 此 基础 上 为 使 SVR 具备 更 好 的 解 
释 性 ， 进 一 步 发展 了 多 轮 末尾 强制 淘汰 法 对 保留 
子 进 行 强制 筛选 ， 该 方法 可 给 出 各 因子 相对 重要 性 
顺序 ， 使 模型 具备 一 定 解 释 能 力 ( 袁 哲 明 等 ， 
2007; 张 永生 等 ，2007 ; 谭 泗 桥 等 ，2007; 谭 显 胜 
等 ，2008 ) 。 最 优 核 函 数 选择 和 非 线 性 变量 钥 选 应 
同步 进行 。 

非 线性 因子 租 选 结果 表明 ， 最 优 核 郧 数 为 径 加 
基 核 (1 =2) ,保留 因子 为 x ，x ，xi ， 对 晴 重 y 预 


测 精 度 影 响 的 相对 重要 性 为 x >x, >%; 在 表 1 给 
定 的 上 下 限 范 围 内 ， 因 子 x ，x3，xs 对 肾 重 影响 较 
小 ( 表 3)。 
2.4 模型 评估 

由 此 得 到 一 个 含 3 个 输入 因子 的 SVR 模型 ， 
现 以 双重 留 一 法 评 佑 该 模型 的 泛 化 推广 能 力 ( 袁 哲 
明 等 ，2007) 。 从 # =2 及 其 3 个 保留 因子 出 发 ， 从 
13 个 样本 中 每 次 拿 出 1 个 作为 独立 测试 样本 ， 其 
余 12 个 样本 再 次 以 留 一 法 Gridregression. py 搜索 寻 
找 最 优 SVR 参数 ， 以 最 优 参 数 c, g,p 对 该 12 个 
样本 Svmtrain 后 预测 (Svmpredict) 独立 测试 样本 。 
双重 留 一 法 预测 结果 MSE 为 0. 0018 ， 表 明 所 建 模 


表 3 非 线性 因子 筛选 与 保留 因子 强制 第 选 及 其 MSE 值 ( 径 向 基 核 ) 


Table 3 Screening variables and compulsorily screening retained variables and their MSE ( x10°) 


筛选 历程 轮 次 筛选 前 的 MSE 值 ， 
Stage Round MSE before screening 
因子 筛选 1 2. 20 2. 85 
Screening 2 1.77 2. 85 
variables 3 1.69 2. 85 
强制 第 选 4 1. 42 2. 85 
Compulsonl 
四 5 1.54 2. 85 


screening 


筛选 掉 的 因子 
Variables screened 
1. 90 1. 81 1. 89 2. 14 1. 77 XG 
1.73 1. 69 1.72 1.72 一 MX3 
1. 93 一 1. 76 1. 42 一 Xs 
1. 88 一 1. 54 一 一 Xa 
1. 76 一 一 一 一 NX 
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型 有 较 好 的 泛 化 推广 能 力 ; 实测 值 最 大 的 4 组 有 3 
组 与 预测 值 接近 ， 仅 N, 稍 差 ( 数 据 未 显示 ) 。 此 处 
配方 优化 更 多 关注 的 是 预测 高 值 的 报 准 程度 ， 通 过 
预测 高 值 找到 实际 最 好 的 处 理 。 可 见 , 上 =2 且 保 
留 因 子 为 ，” ，2%i 的 SVR 模型 可 以 信赖 。 
2.5 第 2 轮 实 验 设计 

从 表 2 第 1 轮 均匀 设计 结果 出 发 ， 可 基于 频次 
统计 寻 优 或 基于 单 因 子 效 应 分 析 两 种 方案 进行 第 2 
轮 实 验 设 计 与 优化 ; 为 显示 UD-SVR 的 有 效 性 ， 同 
时 设计 春 干 参 比 模型 进行 比较 。 
2.5.1 基于 频次 统计 寻 优 的 配方 优化 (UD-SVR- 
1): 以 1=2 为 最 优 核 函数 ， 以 x4，x,，%i 为 保留 
因子 ,对 表 2 的 13 个 样本 训练 建 模 ， 对 x1(12 水 
平 )、x(12 水 平 )、 (12 水 平 ) 共 1 728 个 全 组 合 
待 测 样本 进行 预测 ， 取 预测 平均 肾 重 y (0.25 的 
213 个 处 理 统计 各 因子 频次 如 表 4。 

表 4 预测 平均 肾 重 大 于 0.25 的 213 
个 样本 的 频次 统计 寻 优 结果 
Table 4 Factor s frequency statistics for 213 samples 


with the predicted mean pupal weight >0.2S g 


频次 ， 频次 ， 频次 
Frequency Frequency Frequency 
40 0 8 
48 0 11 
56 0 12 
64 0 15 
72 0 16 
80 0 19 
88 0 21 
96 0 21 
104 19 24 
112 53 24 
120 67 22 
128 74 20 





顶 测 最 优 组 合 为 x; =128，x =10，xs = 15. 5， 
对 应 最 大 预测 值 ” =0.2594。 结 合 预 测 最 优 组 合 和 
表 4，xi (黄豆 粉 ) 应 超过 128， 上限 外 推 至 180， 
下 限 调 整 为 120; 基准 配方 中 %,( 麦 获 ) 含 量 明显 偏 
高 ， 下 限 外 推 至 0， 上 限 调整 为 21.6; 基准 配方 中 
x4( 谍 糖 ) 含量 明 显 偏 低 ， 同 时 饲养 经 验 表 明 较 高 
的 诬 糖 合 量 可 改善 饲料 口感 、 刺 激 昆 虫 取 食 ， 故 下 
限 调整 为 16， 上限 外 推 至 22。 以 3 因子 4 水平 进 
行 第 2 轮 均匀 设计 ， 共 8 处 理 (Ni3 ~ N2o ) 0 表 3 已 
指出 ， 在 表 1 给 定 的 上 下 限 范 围 内 x6，xs ，xs 对 师 


重 影 响 较 小 ， 故 考虑 成 本 可 取 下 限 值 ， 稳 受 起 见 可 
取 均 值 或 基准 值 ; 此 处 取 xs =100，x5 =8，x6 = 
48。 第 2 轮 均匀 设计 及 各 处 理 平均 晴 重 预测 值 、 实 
测 值 见 表 S$， 每 处 理 供 试 幼 虫 48 头 。 

由 表 2 和 表 5 可 知 ， 第 1 轮 均匀 设计 的 12 个 
处 理 实测 最 高 晴 重 为 0. 2563 g; 经 SVR 指导 的 第 2 
轮 均匀 设计 ，8 个 处 理 ( Ni ~ No) 中 有 4 个 师 重 超 
过 0. 2563 g， 特 别 是 Nis 处 理 平均 肾 重 达 0. 2889 g， 
显著 高 于 其 他 7 个 处 理 及 基准 对 照 CK,。 表 明基 于 
频次 统计 寻 优 的 UD-SVR 整体 优化 性 能 较 好 。 
2. S.2 基于 单 因 子 效应 分 析 的 配方 优化 (UD-SVR- 
2): 以 x4，xs，%i 为 保留 因子 ， 对 表 2 的 13 个 样 
本 训练 建立 SVR 预测 模型 。 为 分 析 % 的 单 因 子 效 
应 ,可 将 除 % 外 的 各 因子 固定 为 其 均值 , 令 % 在 
合适 区 间 内 按 一 定 步 长 取 值 ， 产 生 待 测 样本 集 ， 代 
入 SVR 预测 模型 得 预测 值 y, ， 可 知 因 变量 y, 随 x 
的 变化 规律 ， 取 因 变 量 为 极 大 时 x; 的 值 为 该 因子 
最 优 水 平 ， 依 次 获得 3 个 保留 因子 的 最 优 水 平 。 

在 基于 频次 统计 寻 优 的 配方 优化 中 ， 非 保留 
子 的 取 值 具 一 定 随意 性 ; 本 方案 基于 单 因 子 效应 分 
析 ， 对 非 保 留 因子 同样 给 出 最 优 水 平 : 基于 表 2 的 
13 个 样本 、3 个 保留 因子 ， 轮 流 加 入 一 个 非 保留 因 
子 % 训练 建 模 ; 3 个 保留 因子 取 其 均值 ， 令 x; 在 合 
适 区 间 内 按 一 定 步 长 取 值 ， 产 生 待 测 样本 集 ， 代 入 
模型 得 预测 值 y;, ， 依 次 获得 3 个 非 保 留 因子 的 最 
优 水 平 。 

基于 单 因 于 效应 分 析 模 型 (UD-SVR-2 ) 推测 的 
6 因 了 于 最 优 水 平 组 合 ~x6 分 别 为 172，14.4，68 ， 
21.2，2，40。 实 测 平均 晴 重 达 0. 3044 g， 在 所 有 
处 理 中 最 高 ( 表 S$) ， 显 示 基 于 单 因 子 效 应 分 析 的 
UD-SVR 优化 效果 十 分 突出 。 
2.5.3 参 比 模型 : 参 比 经 验 风 险 最 小 模型 中 ， 由 
表 2 获得 SLR 模型 为 y =0.18074 + 0. 00046x; - 
0. 000162x, + 0. 00016x; + 0. 00071x, (调整 相关 系数 
R, = 0.7420) ; PLS-QPR 考虑 互 作 项 和 平方 项 模 
型 、PLS-QPR 仅 考 虑 互 作 项 模型 、PLS-QPR 仅 考 
虑 平方 项 模型 均 相 当 元 长 ， 且 可 依 表 2 数据 由 DPS 
软件 快捷 获得 ( 唐 启 义 和 冯 明光 ，2002) ， 故 未 列 
出 。4 个 经 验 风险 最 小 模型 推测 的 最 优 组 合 及 其 验 
证 结果 见 表 5。 可 见 ， 参 比 模型 实测 最 高 的 为 PLS- 
QPR-2, 但 也 仪 为 0.2647 g, 与 基准 人 工 饲 料 
(CK, ) 差异 不 显著 ; 参 比 模 型 推测 的 最 优 组 合 预 测 
值 均 高 于 实测 值 ， 尤 以 PLS-QPR-2 偏离 最 大 ; 表 
明 参 比 模型 优化 效果 较 差 。 与 此 相反 ， 基 于 频次 统 
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表 5 第 2 轮 实 验 设计 及 实测 平均 肾 重 
TableS The 2nd-round experimental design and mean pupal weight 





实验 组 Scheme Xl MX2 MX3 Xa Xs 
Ni 180 14.4 100 18 8 

Ni， 120 7.2 100 20 8 

Nis 160 7.2 100 16 8 

Ni 140 14.4 100 22 8 

Ni; 120 21.6 100 16 8 

Nis 160 21.6 100 20 8 

Nio 180 0 100 22 8 
Noo 140 0 100 18 8 
UD-SVR-2 172 14.4 68 21.2 2 
SLR 128 10 150 20 8 
PLS-QPR-1 124 39.6 148 6.4 13 
PLS-OPR-2 128 10 150 2 2 
PLS-QPR-3 120 49.2 99.6 12 13 
CK, 100 100 100 4 4 


肾 重 y( 平 均值 + 标准 误 ) (8g) 
XG Pupal weight (mean + SE) 


预测 值 Predicted value 实测 值 Observed value 


48 0. 2844 0. 2492 +0. 0037 bc 
48 0. 2644 0. 2650 +0. 0059 bBC 
48 0. 2782 0. 2889 +0. 0073 aAB 
48 0.2716 0. 2644 +0. 0096 bBC 
48 0. 2605 0. 2448 +0. 0081 bC 
48 0. 2771 0. 2641 +0. 0068 bBC 
48 0. 2876 0. 2499 +0. 0077 bc 
48 0. 2727 0. 2481 +0. 006 bC 
40 0. 2796 0. 3044 +0. 0077 aA 
48 0. 2756 0. 2574 +0. 006 bC 
68 0. 2737 0. 2613 +0. 006 bC 
98 0. 3292 0. 2647 +0. 0042 bBC 
66 0. 2793 0. 2313 +0. 007 bc 
30 0. 2265 0. 2428 +0. 0033 bc 


Nis ~ Nao : UD-SVR-l 给 出 的 均匀 设计 处 理 ; PLS-QPR-1: PLS-QPR 考虑 互 作 项 和 平方 项 模型 ; PLS-QPR-2 : PLS-QPR 仅 考虑 互 作 项 模型 ; 
PLS-QPR-3 : PLS-QPR 仅 考 虑 平方 项 模型 ; CK, : 基准 人 工 饲 料 对 照 。Ni; - N20 were schemes based on UD-SVR-1; PLS-QPR-1 ，PLS-QPR-2 and 
PLS-QPR-3 are the optimal schemes predicted by the model of PLS-QPR with reciprocation and square, PLS-QPR with reciprocation only and PLS-QPR 


with square only, respectively; CK, is the benchmark formulation for the control. 


计 寻 优 的 UD-SVR-1 所 得 最 优 处 理 Nis 和 基于 单 因 
子 效应 分 析 的 UD-SVR-2 实测 肾 重 分 别 为 0. 2889 
和 0. 3044 g， 均 显著 或 极 显 著 高 于 参 比 模型 与 基准 
对 照 ， 充 分 表明 在 小 样本 前 提 下 UD-SVR 优化 


高 效 。 
3 讨论 


于 第 1 轮 均 勺 设计 数据 ( 表 2) ， 非 线性 因子 
久 计 出 x1，%2，%N4 为 保留 因子 。 基 于 频次 统计 导 
优 的 UD-SVR-1 认为 x1 (黄豆 粉 ) 上 限 应 超过 128 ; 
基准 配方 中 x, (麦苗 ) 为 100， 明 显 偏 高 ， 应 调整 为 
10 或 10 以 下 ; 基准 配方 中 x ( 蕊 糖 ) 为 4， 明 显 偏 
低 ， 应 调整 为 15.5 左右 。 基 于 单 因 子 效 应 分 析 的 
UD-SVR-2 认为 x;，x,，xs 应 分 别 为 172，14.4， 
21.2。UD-SVR-1 和 UD-SVR-2 对 第 2 轮 实 验 设 计 
的 指导 意见 较为 一 致 。 表 5 实际 验证 结果 ，UD- 
SVR-1 指导 的 8 个 均匀 设计 处 理 实测 最 优 的 为 Ni;， 
其 x,，x,，%s 分 别 为 160, 7.2,，16。UD-SVR22 与 
Nj; 人 处 理 肾 重 均 极 显 车 高 于 基准 配方 。 这 说 明 UD- 
SVR 具 较 好 的 解释 性 与 指导 性 。 


梁 章 梅 等 (1999 ) 曾 报 道 一 种 棉铃 贝 人 工 饲 料 
配方 ， 其 平均 肾 重 达 0.33037 g， 高 于 本 文 报道 的 
0. 3044 g。 然 而 ， 由 于 饲料 配方 组 成 的 差异 、 棉 铃 
虫 种 群 不 一 、 室 内 继 代 饲养 代数 不 一 等 ， 两 者 并 不 
具 可 比 性 。 再 者 ， 本 研究 的 目的 更 多 的 是 提供 一 种 
多 因素 多 水 平 配方 优化 与 实验 设计 新 方法 。 

对 一 个 6 因子 的 枫 铃 虫 人 工 饲 料 复杂 配方 优化 
问题 ，UD-SVR 仅 通过 2 轮 22 个 实验 ， 即 获得 一 
个 满意 配方 : 黄豆 粉 172 g/L， 麦 区 14.4 g/L， 醇 
母 漫 崩 68 g/L， 戎 糖 21.2 g/L， 菜 籽 油 2 滴 /L， 维 
生 素 C 户 40 粒 /L，21 金 维 他 片 、 琼 脂 、 山 如 酸 、 
冰 乙 酸 用 量 同 基准 配方 ， 实 测 平均 肾 重 0. 3044 g。 
UD-SVR 预测 精度 高 、 指 导 性 强 、 可 解释 性 好 、 优 
化 高 效 ， 为 解决 多 因素 多 水 平 的 配方 优化 试验 设计 
与 分 析 提 供 了 新 的 有 效 途 径 ， 但 其 普 适 性 仍 需 更 多 
研究 实例 的 支持 。 


参考 文献 (References) 


Bian ZQ，Zhang XC，2000.，Pattern Recognition. 2nd ed. Tsinghua 
University Press ，Beijing。，284 - 303. [边区 祺 ， 张 学 工 ，2000. 
模式 识别 . 第 2 版 . 北京 : 清华 大 学 出 版 社 . 284 -303 ] 


426 昆虫 学 报 Acta Entomologica Sinica 53 卷 


Chakraborty K, Mehrotra K, Mohan CK, Ranka S, 1992. Forecasting 
the behavior of multivariate time series using neural networks. 
Neural Networks, S$: 961 - 970. 

Chang CC, Lin CJ, 2001. LIBSVM.: a library for support vector 
machines. Software available at http: //www. csie. ntu. edu. tw/ ~ 
cjlin/ libsvm. 

Deng NY, Tian YJ, 2004. Support Vector Machine - A New Method in 
Data Mining. Science Press, Beijing. 77 -162, 224 -272. [ 邓 疙 
扬 , 田 英 杰 , 2004. 数据 挖掘 中 的 新 方法 一 一 支持 向 量 机 . 北 
京 : 科学 出 版 社 . 77 -162, 224 -272 ] 

Fang KT, 1980. The application of uniform design - number-theoretic 
method in experimental design. Acta Math. Appl. Sin. , 3(4).: 363 
-372. [ 方 开 泰 , 1980. 均匀 设计 一 一 数论 方法 在 试验 设计 的 
应 用 . 应 用 数学 学 报 , 3(4) : 363 -372| 

Gupta S, Manohar CS, 2004. An improved response surface method for 
the determination of failure probability and importance measures. 
Structural Safety, 26: 123 -139. 

Liang GM, Tan WJ, Guo YY, 1999. The improvement of artificial 
breeding techniques in cotton bollworm. Plant Protection, 25 (2). 
15 -17. | 梁 革 梅 , 谭 维 嘉 ， 郭 子 元 ,1999， 人 工 饲 养 棉铃 虫 技 
术 的 改进 . 植物 保护 , 25(2): 15 -17] 

Mo MH, Pang H, Pang XF, 2007. Optimization of the semi-synthetic 
diet of diamondback moth. Acta Sci. Nat. Univ. Sunyatseni, 46 
(6) : 63 -68. [英美 华 , 庞 虹 , 庞 雄 飞 , 2007. 小 菜 蛾 半 合 成 人 
工 饲 料 配方 的 优化 . 中 山大 学 学 报 (自然 科学 版 ), 46(6): 63 
—68|] 

Rosipal R, Trejo LJ, 2001. Kermel partial least squares regression in 
reproducing Kernel Hilbert space. J. Mach. Learn. Res., (2).: 97 
— 123. 

Tan SQ, Yuan ZM, Bai LY, Xiong JY, 2007. The QSAR modeling of 
herbicide using a combinatorial model based on support vector 
regression and K-nearest neighbor. Chin. J. Pestic. Sci., 9(4): 
324 -329. |[ 谭 泗 桥 , 袁 哲 明 , 柏 连 阳 , 熊 洁 仪 , 2007. 基于 文 
持 向 量 机 回归 与 K- 最 近邻 法 的 组 合 预测 用 于 除草 剂 QSAR 建 
模 . 农药 学 学 报 , 9(4) : 324 -329 ] 

Tan XS, Yuan ZM, Zhou TJ, Wang CJ，Xiong JY, 2008. Multi-KNN- 
SVR combinatorial forecast and its application to QSAR of fluorine- 


containing compounds. Chemical Journal of Chinese Universities, 29 


(1): 95 -99. |[ 谭 显 胜 , 彭 哲 明 , 周 铁 军 , 干 春 娟 , 熊 洁 仪 ， 


2008. Multi-KNN-SVR 组 合 预测 在 含 所 化合 物 QSAR 研究 中 的 
应 用 . 高 等 学 校 化 学 学 报 , 29(1) : 95 -99 |] 

Tang QY, Feng MG, 2002. DPS Data Processing System — Experimental 
Design, Statistical Analysis and Data Mining. Science Press, 
Beijing， 147 -170. [ 唐 局 义 , 冯 明 光 , 2002. 实用 统计 分 析 及 
其 DPS 数据 处 理 系统 . 北京 : 科学 出 版 社 . 147 -170] 

Vapnik VN, 1995. The Nature of Statistical Learning Theory. Springer 
Verlag Press, New York. 87 -189. 

Wu KJ, 1985. A luceme-wheat germ diet for rearing the cotton 
bollworm, Heliothis armigera ( Hiibner). Acta Entomol. Sin., 28 
(1): 22 -29. [ 吴 坤 君 ，1985. 棉铃 忠 的 紫 云 英 - 麦 有 夭 人 工 乌 
料 . 昆虫 学 报 , 28(1): 22 -29] 

Yuan ZM, Xiong JY, Zhang YS, 2007. A novel combinatorial forecast 
method based on support vector machine regression and k-near 
neighbor group and its application in QSAR. J. Mol. Sci., 23(3): 
163 - 169. [ 圳 哲 明 ,能 洁 仪 , 张 永生 , 2007. 基于 SVR 和 KK- 近 
邻 群 的 组 合 预测 在 QSAR 中 的 应 用 . 分 子 科学 学 报 , 23 (3): 
163 -169 | 

Yuan ZM, Zuo B, Tan SQ, Tan XS, Xiong XY, 2009. Experimental 





design and analysis of the optimal fermentation medium based on 
uniform design and support vector regression. Chin. J. Process 
Eng., 9(1): 148 -152. |[ 胡 哲 明 , 左 浅 , 谭 泗 桥 , 谭 显 胜 , 熊 兴 
粹 , 2009. 基于 均匀 设计 与 支持 向 量 回归 的 发 酵 配 方 优 化 . 过 
程 工程 学 报 , 9(1) : 148 -152] 

Zhang XG, 2000. Introduction to statistical learning theory and support 
vector machines. Acta Autom. Sin., 26(1): 32 -42. | 张 学 工 ， 
2000. 关于 统计 学 习 理 论 与 支持 向 量 机 . 自动 化 学 报 , 26(1) : 
32 -42 |] 

Zhang YS, Yuan ZM, Xiong JY, Zhou TJ, 2007. Multidimensional time 
series analysis based on support vector regression and controlled 
autoregressive and its application in ecology. Acta Ecol. Sin., 27 
(6) :2419 -2 424. [| 张 永生 , 袁 哲 明 , 熊 洁 仪 , 周 铁 军 , 2007. 
基于 SVR 和 CAR 的 多 维 时 间 序 列 分 析 及 其 在 生态 学 中 的 应 
用 .生态 学 报 , 27(6): 2 419 -2 424| 

Zhuo YS, Huang YL, Yang JR, 1981. Studies on the artificial diets of 
the cotton bollworm Heliothis armigera ( Hubner). Acta Entomol. 
Sin., 24(1): 108 -110. [音乐 刀 , 黄 月 兰 , 杨 家 荣 , 1981. 棉铃 
忠 人 工 饲 料 的 研究 . 昆虫 学 报 , 24(1): 108 -110] 

(责任 编 缉 : 袁 德 成 ) 


